2. UNIVERSIDAD VERACRUZANA Su aplicación determina si razonablemente puede pensarse que las mediciones muéstrales provengan de una población que tenga una normal distribución teórica. En la prueba se compara la distribución de frecuencia acumulativa de la distribución teórica con la distribución de frecuencia acumulativa observada. Se determina el punto en el que estas dos distribuciones muestran la mayor divergencia. Y a continuación presentamos el desarrollo del estudio acerca de el planteamiento de la hipótesis cuando existen dos poblaciones, y haciendo mención, en lo referente a la proporción: APLICACIÓN ESTADISTICA INFERENCIAL
3. UNIVERSIDAD VERACRUZANA 1.- Estructura de la base de datos Normalmente la estructura que tiene la base de datos es la de utilizar una variable para entrar los resultados de la medición y la otra donde se particiona estos resultados en los dos grupos. 2.-Premisas La única premisa que se necesita es que las mediciones se encuentren al menos en una escala ordinal. Adicionalmente se necesita que la medición considerada sea básicamente continua. 3.-Potencia-Eficiencia Comparada ante la alternativa paramétrica de la t de student para dos muestras independientes (o el modelo de Análisis de Varianza clasificación simple para dos muestras), cuando las premisas paramétricas se cumplen, tiene una potencia eficiencia de cerca del 96%, que tiende a decrecer ligeramente a medida que se aumentan los tamaños de muestra. ESTADISTICA INFERENCIAL
4. UNIVERSIDAD VERACRUZANA 4.-Hipótesis Las hipótesis de esta dócima, expresadas en palabras son: Ho: Las distribuciones poblacionales son iguales. H1: Las distribuciones poblacionales son distintas. Ahora bien se recomienda en general hacer el enunciado de las hipótesis de forma tal que indique en un mayor grado la característica que va a ser docimada. 5.-Estadígrafo y distribución muestral. Designemos por T1 y por T2 las tablas de distribución de frecuencias relativas acumuladas, particionadas en k categorías. Donde el primer subíndice corresponde al número de la muestra y el segundo al orden de la clase. Se analiza entonces en la columna de las diferencias de las frecuencias, en qué clases se obtiene el valor máximo. Se tendrá entonces en símbolos: ESTADISTICA INFERENCIAL
5. UNIVERSIDAD VERACRUZANA El estadígrafo de esta dócima se designa por χ2 y para tamaños de muestra suficientemente grandes, está distribuido según chi-cuadrado con dos grados los de libertad. En símbolos: Goodman, ha demostrado que si los tamaños de muestra son pequeños la dócima se comporta conservadoramente. ESTADISTICA INFERENCIAL
6. UNIVERSIDAD VERACRUZANA El estadígrafo de esta dócima se designa por χ2 y para tamaños de muestra suficientemente grandes, está distribuido según chi-cuadrado con dos grados los de libertad. En símbolos: Goodman, ha demostrado que si los tamaños de muestra son pequeños la dócima se comporta conservadoramente. 6.-Salidas de la dócima Las salidas usuales de una dócima son tres: Máxima diferencia negativa. Donde se muestra cuál es la mayor diferencia negativa alcanzada. Máxima diferencia positiva. Donde se muestra la mayor diferencia positiva alcanzada. Valor de la probabilidad para dos colas. ESTADISTICA INFERENCIAL
10. UNIVERSIDAD VERACRUZANA INTRODUCCIÓN El uso de la Estadística es de gran importancia en la investigación. Casi todas las investigaciones aplicadas requieren algún tipo de análisis estadístico para que sea posible evaluar sus resultados. La elección de uno u otro tipo de análisis estadístico depende del problema que se plantee en el estudio así como de la naturaleza de los datos. Dentro de la estadística se aplican en la investigación los tests o dócimas paramétricos y no paramétricos entre los tests no paramétricos que comúnmente se utilizan para verificar si una distribución se ajusta o no a una distribución esperada, en particular a la distribución normal se encuentran el test de Kolmogorov-Smirnov que es bastante potente con muestras grandes. ESTADISTICA INFERENCIAL
11. UNIVERSIDAD VERACRUZANA El nivel de medición de la variable y su distribución son elementos que intervienen en la selección del test que se utilizará en el procesamiento posterior. De hecho, si la variable es continua con distribución normal, se podrán aplicar técnicas paramétricas. Si es una variable discreta o continua no normal, solo son aplicables técnicas no paramétricas pues aplicar las primeras arrojaría resultados de dudosa validez. ESTADISTICA INFERENCIAL
12. UNIVERSIDAD VERACRUZANA TEORIA En algunos diseños de investigación, el plan muestral requiere seleccionar dos muestras independientes, calcular las proporciones muestrales y usar la diferencia de las dos proporciones para estimar o probar una diferencia entre las mismas. Las aplicaciones son similares a la diferencia de medias, por ejemplo si dos empresas consultoras ofrecen datos de proporciones de personas que van a votar por el PRI y al hacer dos estudios diferentes salen resultados ligeramente diferentes ¿pero qué tanta diferencia se requiere para que sea estadísticamente significativo? De eso se tratan las pruebas estadísticas de diferencias de proporciones. ESTADISTICA INFERENCIAL
13. UNIVERSIDAD VERACRUZANA El estadístico Z para estos casos se calcula de la siguiente manera: 1 ˆp = proporción de la muestra 1. 2 ˆp = proporción de la muestra 2. 1 p = proporción de la población 1. 2 p = proporción de la población 2. 1 n = tamaño de la muestra 1. 2 n = tamaño de la muestra 2. ESTADISTICA INFERENCIAL
14. UNIVERSIDAD VERACRUZANA Contraste bilateral El contraste bilateral sobre la diferencia de proporciones es: Entonces se define: y se rechaza la hipótesis nula si o si ESTADISTICA INFERENCIAL
15. UNIVERSIDAD VERACRUZANA Contrastes unilaterales En el contraste se rechazará H0 si Para el test contrario: se rechaza H0 sí ESTADISTICA INFERENCIAL
20. La distribución de la diferencia entre las dos mediciones realizadas tiene que ser normal (o cualquier distribución, en el caso de que los tamaños muestrales sean grandes, n>30)
26. Tamaño de muestra “grande” para que se cumpla el teorema del límite central
27. En variables numéricas, no deben haber valores extremos o sesgos que limiten la representatividad del promedio como medida de tendencia central.ESTADISTICA INFERENCIAL